#autoencoders dispersos

Una visión geométrica para comprender conceptos en autoencoders dispersos

Explora cómo la geometría revela el aprendizaje de conceptos en autoencoders dispersos y permite interpretar neuronas de forma clara.

2026-06-08 · 2 min

TEVI: Edición de representaciones visuales con autoencoders dispersos para alinear visión y lenguaje

Descubre TEVI, un método que usa autoencoders dispersos para editar embeddings visuales y mejorar la alineación entre imágenes y texto en modelos como CLIP. Mejora la recuperación y robustez.

2026-06-08 · 2 min

Detección y mitigación de alucinaciones en Whisper con autoencoders dispersos

Reduce alucinaciones de Whisper hasta un 86% usando autoencoders dispersos. Aprende la técnica de steering en representaciones ocultas.

2026-06-08 · 2 min

Concept-SAE: interfaz controlable e invertible para SAEs

Concept-SAE: controla y edita conceptos en redes neuronales, mejorando interpretabilidad y detectando ataques adversariales. ¡Descúbrelo!

2026-06-05 · 2 min

Concept-SAE: Interfaz de Conceptos Controlable e Invertible

Descubre cómo Concept-SAE controla conceptos específicos en modelos de IA, mejorando interpretabilidad y detección adversarial.

2026-06-05 · 2 min

Autoencoders Dispersos Conscientes del Subespacio para Interpretabilidad Mecanicista

Descubre cómo SASA mejora la interpretabilidad de LLMs reduciendo la fragmentación de características y usando la mitad de los tokens de entrenamiento.

2026-06-05 · 2 min

Aprendizaje activo basado en activaciones: desafíos en aprendizaje en contexto

¿Las activaciones de MLP mejoran el aprendizaje en contexto? Un estudio revela que no. Conoce los hallazgos y el futuro con autoencoders dispersos.

2026-06-04 · 2 min

Cuantización y características interpretables: análisis con autoencoders dispersos

La cuantización no destruye todas las características interpretables: un análisis revela que el 62% persiste en INT6, pero las métricas engañan.

2026-06-03 · 2 min

Cómo la optimalidad estructura diccionarios dispersos: teoría SAE

Descubre cómo la teoría de optimalidad explica el comportamiento de los Autoencoders Dispersos (SAE) y sus diccionarios dispersos. Mejora la interpretabilidad de las representaciones neuronales.

2026-06-02 · 2 min

RAIGen: Identificación de Atributos Raros en Modelos Generativos de Imagen

RAIGen descubre atributos raros y subrepresentados en modelos de imagen como Stable Diffusion, sin categorías predefinidas. Mitiga sesgos y amplifica características minoritarias.

2026-06-02 · 2 min

AdaptiveK: Autoencoders Dispersos por Complejidad

AdaptiveK ajusta dinámicamente la esparcidad según la complejidad semántica, mejorando interpretabilidad y reconstrucción de modelos de lenguaje.

2026-06-02 · 2 min